Amerika’da ‘Veri Bilimciliği’ terimi birçok pozisyonu kapsayan bir üst tanımlama olarak kullanılmaktadır.
Bu pozisyonların bazıları yenice ortaya çıkmış bazıları ise oldukça eski olup veri bilimciliği terimi popülerleştikten sonra veri bilimciliği çatısı altında da kapsanmaya başlamışlardır.
Bu yazıda Veri Bilimciliği terimi genel geçer kullanımı içinde kapsadığı pozisyonları spesifik olarak tanımlayarak kavram karmaşasını gidermeye çalışacağım. Aşağıda işleyeceğim beş grup kesin çizgilerle birbirinden ayrılmasa da iş ilanlarında ya da şirketlerin organizasyonlarında spesifik olarak kullanılan tanımlamalardır.
Genelci veri bilimciliği dijital olarak toplanmış veri kümelerinin, işlenmesi analizi, görsellenmesi, özetlenmesi; modellenmesi ile sistemlerin performanslarının ölçülmesi ya da bu sistemlerin doğalarının ya da gösterdikleri davranışların tanımlamakla ve anlamakla uğraşır. Sonrasında bu çıktıları kullanarak iş problemlerine veriye dayanan çözümler geliştirirler. Veri bilimcileri çoğunlukla istatistik, matematik, mühendislik bilgisayar ve ekonomi lisans eğitiminden gelirler. Bu pozisyonda çalışan veri bilimcilerinin istatistik ya da makina öğrenmesi gibi konularda çok detaya inmesi beklenmez.
2000’li yıllardan önce istatistikçi, tahminsel modelleme uzmanı ya da ekonometri uzmanı olarak tanımlanan pozisyonlar 2010’lar ve sonrasında veri bilimciliğinin geniş şemsiyesi tarafından yutulmaya başlamıştır. Bu dalda çalışanlar çoğunlukla üniversitelerin istatistik, uygulamali istatistik, ekonomi, ekonometri gibi bölümlerinde yüksek lisans ya da doktora yapmışlardır. Amaç toplanmış verilere dayanarak istatistiksel modeller kurmak ve bu modellerle iş süreçlerini otomatize etmek ya da iyileştirmektir.
Örneğin bankalarin kimlere hangi koşullarda kredi vereceklerini ya da çağrı merkezlerinin hangi müşterilere öncelik vereceğini otomatize ve optimize eden modeller ve sistemler gelistirirler. Daha çok başvurdukları araçlar denetimli öğrenme yöntemleri ve sıklıkçı (frequentist) istatistiksel yöntemlerdir.
Makina Öğrenmesi daha geniş olan Yapay Zeka alanin bir alt dalıdır. Makina Öğrenmesi Veri bilimcileri değişik kaynaklardan veri kümelerini istatistiksel modeller ve ya algoritmalar kullanarak tahmin ve karar üreten sistemler geliştirirler. Bu sistemlerin ana ozelligi açık bir şekilde kurallara dayalı değil de daha genel bir şekilde kodlanmış olmalari ve veri kümesine yeni veriler eklendikçe kendilerini iyileştirmeleridir. Bu alandaki veri bilimcileri istatistik, bilgisayar bilimi, elektronik mühendisliği gibi bölümlerden mezundurlar. Konuşmayı yazıya çevirme modelleri, görsel işleme ve kategorizasyonu, doğal dil işleme gibi sistemler bu alana girer.
Daha çok başvurdukları araçlar denetimsiz öğrenme yöntemleri, bayesian ağ modellemesi, standart ve derin sinirsel ağ modellemesi gibi yöntemlerdir.
Yöneylem araştırması 1950’lere kadar giden bir uygulamalı matematik dalıdır. Genellikle endüstri mühendisliği programlarında işlenir. Amaç üretim ve hizmet sistemlerinin matematik ya da bilgisayar benzetim modelleri kullanarak tasarlanması, iyileştirilmesi, eniyileştirilmesidir. Eskiden beri yöneylem araştırmacısı, endüstri mühendisi, optimizasyon mühendisi gibi iş başlıklarıyla aranmasına rağmen gitgide daha çok veri bilimciliği bir alt dalı olarak da görülmeye başlanmıştır. Bunda veri bilimciliği teriminin popülerliğinin etkisi çoktur. Yöneylem Araştırması Veri Bilimcileri genellikle endustri muhendisligi sistem muhendisligi ya da uygulamali matematik gibi alanlardan yüksek lisans ya da doktora derecesiyle mezun olmuşlardir.
Daha çok başvurdukları araçlar doğrusal ve kesikli eniyileme modelleri, bilgisayar benzetimi, sıra teorisi modelleri gibi yöntemlerdir.
Veri bilimi mühendisleri ya da yazılımcıları genelde diger veri bilimcileriyle birlikte calisip sistemin verilerinin toplanması gereken veri akış sistemlerini, geliştirilen modellerin canlıya (production) taşınması için gerekli yazılım geliştime işleriyle ugrasirlar. Diğer veri yazılımcılarının geliştirdikleri prototipleri yazılım muhendisligi teknikleriyle robust ve ölçeklenebilir bir hale getirmek de bu mesleğin çoğunlukla bir parçasıdır. Bu alandaki mühendisler genelde bilgisayar bilimi, bilgisayar elektronik ya da çok daha çesitli muhendislik alanlarindan mezundurlar. Yazilima yakin olmasi nedeniyle yazilim alaninda olduğu gibi alaylı bir şekilde çok değişik eğitim alanlarından bu alana girip başarılı olanlara sıklıkla rastlanır.
Yaptıkları işlere örnek olarak bir tahminsel veri bilimcisinin geliştirdigi kredi skorlama modelini bir web sitesi ile entegre etmek ve onu binlerce ya da milyonlarca kullanıcıyı kotarabilecek bir şekilde geliştirmek verilebilir.
Veri Bilimciliğinin Çeşitleri 2020-08-20